AI是一个不设限的新世界,它与所有人紧密相连。
它正在改变从业者和普罗大众的生活,并诠释出平等包容、想象力丰富、温暖有爱的未来职业魅力。
如果把人工智能比作一个咿呀学语的孩子,那么数据标注员就是他人生中的第一个老师,他们负责把每天人类社会产生的海量数据经过清洗和标注,换成机器可以理解的语言。
本期显微故事讲述了一群数据标注师,他们之中:
有人因为疫情原因错过春招,在外地找了一份实习却无法忍受背井离乡的孤独感,回到家乡转型为数据标注员;
有人天生没有左手,处处遭受歧视,在百度的数据标注基地里感受到包容的氛围,重寻生活的自信;
有人全职带娃出来找工作,却因条条框框的限制遭受一次又一次地被拒绝,偶然发现数据标注员的工作满足她的一切要求;
有人退伍后自主创业,在实体经济摸爬滚打十几年后却因电商崛起备受打击,重振旗鼓打造了自己的数据标注员团队,在四个月亏了三十万后继续坚持,最终将团队扩大到170人;
有人正值壮年,换了多份工作后坚定地认为数据标注这个赛道的前景广阔,深耕专业技能,成了数据标注的培训员。
这些人由于各种原因来到了百度数据标注基地,意外成为了人工智能的“铺路者”。
以下是关于他们的真实故事:
“只要想创业,多晚也不迟”
我尝过创业成功的喜悦,也体会过人到中年的彷徨。
退伍后,我在县里的商场租了两间柜台,从山西省的一个鞋厂里进货,主要卖女鞋。当时还没有电商,我的生意还算不错,几年后,就从一个小商贩变成了广州知名品牌的代理商。但有了网购后,合作品牌对线下的支持度急剧减少,很多优惠条件和政策也都陆续取消。2017年左右,朋友说在网上标注一些图片能挣钱,这是我第一次听说数据标注员这种工作。反正闲着也是闲着,我就研究起了百度众测这些平台。我深入学习了一下这个行业和工作方式,抱着试一试的心态,辗转拿下了百度众测的代理权。接收到数据标注任务后,逐步搭建起了一个专业的团队。这个行业的门槛不高,和我类似的代理商很多,竞争异常激烈。一开始,我运营不善,四个月里亏了30多万,也看到了很多企业撤资导致代理商关门的情况。首先人工智能肯定是未来趋势,只要有人工智能的发展空间,就意味着前期数据标注必须有人来完成。其次,当时百度在太原开了数据标注基地,我觉得是一个机会——和大企业合作能够保障单量,平台也会提供我们一些补贴和帮助,帮我们从众多数据标注代理公司里脱颖而出,吸引更多高质量人才。坚持的曙光很快就到来了。第二年,随着其他不良代理商被淘汰出局、高质量人才逐步向我手里汇集,我从百度手里接到的订单也越来越多。为了弥补人才的缺口,我还和太原当地高校的合作,积极找计算机相关专业的实习生来工作,并鼓励他们加入我的团队。2020年,全球疫情爆发,但我们团队没有停工,我还给受疫情影响无法来基地办公的员工配备了电脑,让大家居家办公完成任务。于是,整个疫情期间,我们团队出色地完成了接到的订单,积累了一大批客户资源。
很多老队友听说我现在的工作都非常惊讶,他们大多已退休,赋闲在家,每天不是带孩子,就是下棋喝茶。但我不喜欢这样的生活,我是一个活到老、学到老的人,一刻也闲不住。更何况,在这个行业里大多是年轻人,每天和一群20多岁的孩子在一起工作,我的心态也变得年轻。创业也是,只要你抓到机会,坚持下去,不管年纪多大都可能成功。2020年全球疫情蔓延,但当时的我并没有意识到我所面临的是什么,每天都在拿“疫情好转后再去找工作”做借口家里蹲,没有参加学校组织的春招。疫情过后,我才发现周围的同学们要么已被企业录取,要么备战考公考研。只有我,像一个局外人一样,游离于他们之外。我也曾在西安做过会计方面的实习生,但枯燥、乏味的工作环境,以及触手可及的职业天花板让我十分犹豫。焦虑之下,我每天都在58同城上翻翻找找,恰好看到那时百度在太原创办人工智能基础数据产业基地,需要大量的数据标注员。我从小就对计算机很感兴趣,但填志愿却被父母要求填金融专业,原因是女孩子学金融找工作会方便得多。看到数据标注员的招聘启事后,我决定试试。幸好,面试官并没有因为我的专业把我刷掉,相反还特别看重我的理想。我加入了百度的人工智能基础数据产业基地,投身进AI训练师这个岗位。最初我对人工智能没什么概念,仅仅知道些皮毛,但后面经过了解与学习,发觉内心想找的就是这样一份工作。我以前认为无人驾驶技术就靠程序员写几段代码,现在才知道前期需要无数和我一样的人做大数据标注,相当于“铺路”。只有前期摸着石头过河这个方面做好了,后面的发展才能条条大路通罗马。在这里,公司里的前辈愿意指导我,同事们也都愿意互相帮忙,我还清楚地意识到我是他们培养的梯队里的一部分,我对于他们来说是新鲜血液,可以有效促进公司的活力。
大部分应届生其实不太明白自己擅长什么、未来到底应该坚持哪份职业,但我很庆幸我在对的时间遇到了对的团队。我在这里做了3个月左右,就从普通批注员成长为组长。很多朋友都问我,比起做会计工作,这个行业工资不高,为什么还要继续呢?但我认为,相比短期的收入,明确而稳定的成长、以及职场上升通道是更值得年轻人去追求的。未来,我会选择继续在这个行业发展,深耕自己的专业技能,在基地里完善自己各方位的能力,和对的团队做对的事情。数据标注行业有很多值得深入研究的地方。入门者大多觉得这项工作机械重复,但实际上,如果你不思考就随意批注,则会增加未来人工智能识别的风险。拿我现在所从事的项目来说,我需要确认和标注路上的施工地段。只有批注后,在导航时地图才不会给你推荐相应的道路,这都需要提前判断。此外,无人车行驶到一段路时它会自行的拍摄连续的图片,我们则需要对这个图片上车辆所行驶的车道旁边两侧的线进行标注,识别这个线是虚线还是实线,匹配它所对应的属性,人工智能虚线车辆可以进行变道,实线不可以进行变道。在外界眼里,人工智能已经具备了自主学习的能力,但其实人工智能的成长离不开我们这群“老师”的帮助。这个“学生”并不怎么机灵,比如当我们拿一个红苹果给它并教会它识别,再拿一个绿苹果给它,因为颜色差异它就不认识;所以我们的职责就是不断地帮助它去识别不同颜色、大小,甚至是被咬一块或者坏掉的苹果,直到我们随便拿一个苹果,它都能认识。
对于这份工作,家里人和我都是十分满意,毕竟不是谁都为AI这个行业引水。现在,我看到无人驾驶的时候,就会想到这里面也包括了自己的标注工作。在疫情期间,我更能感受到这份工作的意义所在,如果武汉疫情能够应用无人驾驶,那么我们将能够极大地降低疫情期间的物资运输、医护人员接送等特殊行业的工作难度。新兴行业给传统行业找到了新的突破口,但随着越来越多人加入这个行业后,我也察觉到了危机感。目前的我打算把学历提上去,总结出更有价值的培训方法和管理技巧,继续做好培训师的工作。没结婚之前,我是一家企业的内勤数据专员,生了孩子之后,为了更好地照顾孩子,理所应当地按着丈夫的期望当了全职妈妈。抚养孩子给我带来了莫大的幸福感,但也同时伴随着这些无力。比如每个月和索要生活费而丈夫质疑我钱都花哪里了,还有孩子长大后总问我为啥我上班,和人介绍母亲就说“我妈是个家庭妇女”。但重返职场才发现,能让我选择的工作接近于零。可想而知,一个已经与社会脱节很多年,又没有专业技能的大龄宝妈,又如何能够在人才市场立足呢?今年年初,朋友推荐我试试做数据标注员。我也没抱太大期待,网上的兼职我试过很多,大多都是骗人的,我抱着怀疑的态度参与了这个线上兼职。因为我有计算机从业经验,上手数据标注难度不大,我能在平台上完成语音、人脸、道路的标注操作,甚至连眼底检查片、肺部X光片等技术含量较高的也能胜任。一个月后,我挣了三千多块钱,相当于我老公一半的月薪。于是,我从兼职变为了全职,如今每天能完成将近一千张图片标注。在基地里,我做过2D无人车、飞机场分割、车道线标注等等一些项目,在疫情后期,我们还给戴口罩的人脸做图像标注:在采集大量的戴口罩的人脸照片后,对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准的标注,标注的特征点越多,AI就越能精确地识别戴口罩场景下的人脸,让人们在不摘口罩的情况下也能实现精确的体温测量,或是通过人脸闸机。
总体而言这份工作难度并不大,我也能够从容对付,甚至可以说完全是为我这种时间不自由的宝妈量身定制的,即使临时有事情,我也能够抽得出手,忙的时候在家里也可以办公。很多人觉得这份工作很枯燥,但其实我每天都在接触新事物。人工智能涉及的领域包括教育、安防、金融、交通医疗和电商等,陌生的领域每天都在挑战我的学习能力。这个行业不仅让我找回了从前工作的感觉,还给了我极大的自信。通过这份职业我能接触到AI技术,例如人工智能、无人驾驶等方面的知识,当孩子问我在做什么时,我也能给孩子讲这方面知识,让孩子觉得自己的妈妈在做一件很厉害的事情。平均薪资并不高的山西,这份离家近、稳定的工作让已处中年的我也有一份莫名的心安,而周围的年轻人也在时时提醒我并没有老去,我仍可以追求自己喜爱的事业,有做好一份工作的能力。“也许我和大家看起来不一样,但在这里一切都是平等的”我天生没有左手。相比其他意外残疾的人,我已经能熟练使用右手学习、生活。但大学毕业后,最困扰我的问题是,可供我选择的工作实在太有限了。虽然我读的专业是计算机,但身体状况不允许我和大部分人一样参与互联网大厂的面试。校招时我选择了学校调剂,被安排到一家带有福利性质的印刷厂工作——那家工厂有一半以上是残障人士。那里的工作很简单又轻松,我每天要做的就是用机器给档案袋的打上孔,可一个月的工资只有两千左右。这份工作没有给我带来任何成就感,厂里的领导只是机械性地安排我们工作,让我觉得自己和面前的印刷机没有两样。几年后,我就毅然决然地辞职了。后来,听说百度在山西太原开设了全国范围内人员和产值规模最大的单体数据标注基地,招纳数据标注员。
图 | 百度与山西共建百度(山西)人工智能基础数据产业基地我怕见面尴尬就先给负责人打电话,告诉了他我本人的情况,然后询问我是否可以去?负责人的回答是:“没有任何问题。”更让我感动的是,面试官全程只问了我的工作经验、介绍了接下来所要做的事情,当场就回复我说第二天就可以来参加工作。我顺理成章地成为了一名数据标注员。刚开始我从2D项目做起,接受一遍培训后,我就可以自主动手做了。我天生空间感很好,并没有太多的不适。我一个月的工资有4000多,比我很多同学都要高。在百度数据标注基地里的生活比之以往有太多改善和不同。在这里,我和其他同事没有什么不同,也不会因为我是残疾人就质疑我的工作能力。数据标注员的工作对残疾人群体的包容性很高。在这里,我学到很多人工智能领域的知识,每一次换项目都能很好的满足我对新鲜感的要求。虽然我的世界没有左手,但却不妨碍我在基地里找到自己存在的价值——无论多少,但我至少在为这个世界的科技发展做了一点微小的贡献。每个人都有天生的一些缺陷,没有人是十全十美的,即使是女神维纳斯也有断臂的缺陷呢。
3月23日,在百度回港上市的当天来了一位特殊的敲钟人,郭梅。
和上文提到的边郑娟、李小萌等人一样,郭梅也是万千数据标准员的一份子。在来百度做数据标注员之前,她是8岁孩子的母亲,几年前举家来到太原生活,一度陷入找不到工作的窘境。2018年9月百度与山西省转型综合改革示范区签约,在当地建立了数据标注基地,也让郭梅摆脱了生活和工作的迷茫,参与到了人工智能的科技前沿工作。“现在是人工智能的社会,我就是时代新人”,郭梅在敲钟现场说道。几年的时间里,无数普通人也借由数据标注员这份职业,搭乘了科技的高速就业列车,他们从煤矿或是工地里走出来,可以实现梦寐以求的坐在办公室工作,享受着午后照射进来的阳光,由衷地感慨一句人生值得。截止目前,百度已从全国各地引入35家国内优秀的数据标注企业入驻百度山西数据标注基地,基地总人员规模近3000人,累计实现产值超2亿元。正如郭梅在敲钟当日所说,“数据标注员的工作看似平凡,但又不普通,它给予了每个普通人一个离科技更近一步的机会,为人工智能贡献一份自己的力量”。也正因如此,对于每一个百度数据标注员来说,3月23日也注定是不平凡而充满荣誉的一天。这是一个最好的时代,科技的发展给予了每个人创造价值的可能性。这也是一个最充满想象的时代,每一位心怀梦想的人,终会奔向星辰大海。
腾讯科技 | 36氪 | 虎嗅 | 钛媒体 | 界面新闻
Pingwest品玩 | 第一财经CBNData | 百家号 | 凤凰新闻
ZAKER | 企鹅号 | 今日头条 | 知乎 | 微博头条
创业邦 | 澎湃 | 新浪创事记 | 前瞻网 | 网易科技